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@ Chrornatin-Regulatorgene 

(57) Die Deregulation von Chromatinregulator-Genen, die eine 
SET-Domane aufweisen, spieht eine Rolle bei bestimmten 
Krebserkrankungen. Diese Gene konnen somrt, insbesonde- 
re die SET-Domane als solche, ais Grundlage fur die 
Diagnose und Therapie dieser Erkrankungen dienen. 
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Beschreibung 

Die vorliegende Erfindung bezieht sich auf Gene, die 
eine Rolle bei der Regulation von Chromatin spielen, 
und ihre Verwendung fQr die Therapie und Diagnostic 

Die funktionelle Organisation von eukaryotischen 
Chromosomen in Centromere, Telomere sowie in eu- 
und heterochromatische Regionen stellt einen entschei- 
denden Mechanismus zur Gewahrleistung der genauen 
Replikation und Verteilung der genetischen Informa- 
tion bei jeder Zellteilung dar. Im Gegensatz dazu sind 
Tumorzellen haufig durch chromosomale Rearrange- 
ments, Translokationen und Aneuploidie charakterisiert 
(Solomon et aL, 1991 ; Pardue, 1991). Obwohl die Mecha- 
nismen, die zu einer erhdhten Chromosomeninstabilitat 
in Tumorzellen fuhren, noch nicht geklart sind, haben es 
in jungster Zeit eine Reihe von experimentellen Syste- 
men, beginnend mit telomerischen Positionseffekten in 
Hefe(Renauld et al, 1993; Buck und Shore, 1995; Allshi- 
re et aL, 1994), uber Positionseffekt- Variegation (PEV) 
in Drosophila (Reuter und Spierer, 1992), bis zur Analy- 
se von Translokationsbruchpunkten in humanen Leuka- 
mien (Solomon et aL, 1991; Cleary, 1991), ermoglicht, 
einige chromosomale Proteine zu identifizieren, die an 
der deregulierten Proliferation ursachlich beteiligt sind. 

Erstens wurde festgestellt, daB die Oberexpression 
einer verkiirzten Version des SIR4-Proteins zu einer 
verlangerten Lebensdauer in Hefe fuhrt (Kennedy et aL, 
1995). Da SIR- Proteine zum Entstehen multimerer 
Komplexe an den stillen "Mating Type Loci" und am 
Telomer beitragen, konnte es sein, daB uberexprimier- 
tes SIR4 mit diesen heterochromatinartigen Komplexen 
interferiert, was schlieBlich zu einer unkontrollierten 
Proliferation fuhrt Diese Annahme steht im Einklang 
mit der Haufigkeit des Auf tre tens einer deregulierten 
Telomerenlange in den meisten humanen Krebsarten 
(Counter et al„ 1992). 

Zweitens wurden mittels genetischer Analysen von 
PEV in Drosophila eine Reihe von Genprodukten iden- 
tifiziert, die die Chromatinstruktur an heterochrorriati- 
schen Positionen und innerhalb des homeotischen Gen- 
clusters verandern (Reuter und Spierer, 1992). Mutatio- 
nen einiger dieser Gene, wie modulo (Garzino et al, 
1992) und polyhomeotic (Smouse und Perrimon, 1990), 
konnen in Drosophila die deregulierte Zellproliferation 
oder den Zelltod verursachen. Drittens wurden Sauge- 
tierhomologe von sowohl Aktivatoren (trithorax oder 
trx-Gruppe) als auch Repressoren (z. B. polycomb oder 
Pc-Gruppe) der Chromatinstruktur von homeotischen 
Drosophila-Selektorgenen beschrieben. Unter diesen 
hat sich vom humanen HRX/ALL-1 (trz-Gruppe) ge- 
zeigt, daB es an der durch Translokation induzierten 
Leukamogenese beteiligt ist (Tkachuk et aL, 1992; Gu et 
aL, 1992), und daB die Oberexpression des Maus-bmi 
(Pc-Gruppe) zum Entstehen von Lymphomen fuhrt 
(Haupt et aL, 1991; Brunk et aL, 1991; Alkema et aL, 
1995). Ein Modell fur die Funktion chromosomaler Pro- 
teine laBt darauf schlieBen, daB diese multimere Kom- 
plexe bilden, welche in Abhangigkeit von der Ausgewo- 
genheit zwischen Aktivatoren und Repressoren im 
Komplex den Kondensationsgrad der umliegenden 
Chromatinregion bestimmen (Locke et aL, 1988). Eine 
Verschiebung dieses Gleichgewichts durch Oberexpres- 
sion einer der Komponenten des Komplexes zeigte eine 
Neuverteilung von eu- und heterochromatischen Regio- 
nen (Buck und Shore, 1995; Reuter und Spierer, 1992; 
Eissenberg et aL, 1992). Dieser Dosiseffekt kann die 
Chromatinstruktur an vorbestimmten Loci destabiiisie- 
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ren, was letztlich zu einem Obergang vom normalen 
zum transformierten Zustand fuhrt. 

Trotz der Charakterisierung von HRX/ALL-1 und 
bmi als Protoonkogene, die die Chromatinstruktur ver- 
5 andern konnen, ist das Wissen uber Saugetiergenpro- 
dukte, welche mit Chromatin wechselwirken, noch sehr 
beschrankt Im Gegensatz dazu wurden durch geneti- 
sche Analysen von PEV in Drosophila ca. 120 Allele fur 
Chromatinregulatoren beschrieben (Reuter und Spie- 

io rer, 1992). Kurzlich wurde eine carboxyterminale Re- 
gion mit Ahnlichkeit in der Sequenz identifiziert, die 
einem positiven (trx, trx-Gruppe) und eine negativen 
(E(z), Pc-Gruppe) Drosophila-Chromatinregulator (Jo- 
nes und Gelbart, 1993) gerneinsam ist. Daruberhinaus ist 

15 dieser Carboxyterminus auch in Su(var)3— 9, einem do- 
minanten Supressor der Chromatinverteilung in Droso- 
phila, konserviert (Tschiersch et aL, 1994). 

Bei der vorliegenden Erfindung wurde von der Ober- 
legung ausgegangen, daB diese als "SET" bezeichnete 

20 Proteindomane (Tschiersch et al., 1994) wegen ihrer 
evolutionaren Konservierung und dem Vorhandensein 
in antagonistischen Genprodukten eine neue Genf ami- 
lie entwicklungsgeschichtlich wichtiger Saugetier-Chro- 
matinregulatoren definiert Daruberhinaus tragt die 

25 Charakterisierung weiterer Mitglieder der Gruppe von 
SET-Domane-Genen, neben HRX/ALL-1, zur Aufkla- 
rung der Mechanismen bei, die dafur verantwortlich 
sind, daB strukturelle Veranderungen im Chromatin zur 
malignen Transformation fuhren konnen. 

30 Der vorliegenden Erfindung lag somit die Aufgabe 
zugrunde, humane Chromatinregulatorgene zu identifi- 
zieren, ihre Funktion aufzuklaren und sie fur die Dia- 
gnostic und Therapie einzusetzen. 

Zur Losung dieser Aufgabe wurde zunachst die Se- 

35 quenzinf ormation der SET-Domane benutzt, um aus hu- 
manen cDNA-Banken die zu den SET-Domane-Genen 
von Drosophila homologen humanen cDNAs zu erhal- 
ten. Es wurden zwei cDNAs erhalten, die Humanhomo- 
loge von E(z) bz w. Su( var)3— 9 darstellen; die entspre- 

40 chenden humanen Gene wurden als KEZ-2 and H3— 3 
bezeichnet (vgl. unten); auBerdem wurde eine variante 
Form von HEZ-2 identifiziert, die als HEZ-1 bezeichnet 
wurde. 

Die vorliegende Erfindung betrifft somit DNA-Mole- 

45 kule, enthaltend eine fur ein Chromatinregulator-Prote- 
in, das eine SET-Domane aufweist, kodierende Sequenz 
oder eine Teilsequenz davon, dadurch gekennzeichnet, 
daB sie die in Fig. 6 oder in Fig. 7 dargestellte Nukleo- 
tidsequenz aufweisen. Die erfindungsgemafien DNA- 

50 Molekiile werden im folgenden auch als "erfindungsge- 
maBe Gene" bezeichnet 

Die erfindungsgemaBen Gene tragen die Bezeich- 
nung HEZ-2 und H3— 9. 

Die Erfindung betrifft in einem weiteren Aspekt die 

55 von diesen Genen abgeleiteten cDNAs, einschlieBlich 
ihrer degenerierten Varianten; Mutanten, die fur funk- 
tionelle Chromatinregulatoren kodieren sowie Varian- 
ten, die auf eine Genduplikation zuruckzufuhren sind; 
ein Beispiel dafur ist HEZ-1, dessen Sequenz im Ver- 

60 gleich mit HEZ-2 in Fig. 8 dargestellt ist 

Zur Losung der im Rahmen der vorliegenden Erfin- 
dung gestellten Aufgabe wurde im einzelnen wie folgt 
vorgegangen: Ausgehend von der Sequenzinf ormation 
von der konservierten SET-Domane, wurde unter redu- 

65 zierter Stringenz eine humane B-Zell-spezifische 
cDNA-Bibliothek mit einer gemischten Drosophila- 
DNA-Sonde, die fur die SET-Domanen von E(z) und 
Su(var)3— 9 kodiert gescreent Aus 500.000 Plaques 
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wurden 40 primare Phagen ausgewahlt Nach zwei wei- 
teren Runden Screening zeigte sich, daB 31 Phagen fur 
authentische E(z)-Sequenzen kodieren und daB funf 
Phagen E(z)-Varianten darstellen. Im Gegensatz dazu 
hybridisierten nur zwei Phagen mit der Sonde, die die 
SET-Domane von Su(var)3— 9 allein enthielt Die Pha- 
geninserts wurden mittels Polymerasekettenreaktion 
(PCR) amplifiziert und mittels Restriktionskartierung 
und Teilsequenzierung analysiert Representative 
cDN A- Inserts wurden 

subkloniert und fiber ihre ganze Lange sequenziert Die 
5'-Enden wurden isoliert, indem positive Phagen noch 
einmal mit 5'-DNA-Sonden gescreent wurden, worauf 
nach Subklonierung komplette cDNAs erhalten wur- 
den. 

Die komplette, fur das humane Homologe von E(z) 
kodierende cDNA wurde als HEZ-2 und die DNA, die 
fur das humane Homologe von Su(var)3— 9 kodiert, 
wurde als H3— 9 bezeichnet Insgesamt betragt die 
Identitat der Aminosauren zwischen Drosophila und 
den humanen Proteinen 61% fur HEZ-2 und 43% fur 
H3— 9, wobei die C- terminate SET-Domane sehr hoch 
konserviert ist (88% fur HEZ-2 und 53% fur H3— 9). 
Der Sequenzvergleich zeigte weitere deutliche Homo- 
iogieregionen, z. B. eine Cystein-reiche Domane in 
HEZ-2 und eine Chromo-Box in H3— 9. (In polycomb 
wurde gezeigt, daB die Chromo-Box die fur die Wech- 
selwirkung zwischen DNA und Chromatin wesentliche 
Domane ist; Messmer et al, 1992). Im Gegensatz dazu 
fehlen die 207 Aminosauren, die das aminoterminale 
GTP-Bindungsmotiv des Drosophila-Proteins enthal- 
ten, im putativen humanen Homologen H3— 9. 

Der Vergieich der Arninosaure-Sequenzen zwischen 
den Drosophila- und den humanen Genen ist in den 
Fig. 1 und 2 dargestellt: 

Fig. 1 zeigt den Vergieich der Aminosaure-Sequenz 
zwischen HEZ-2 und von Drosophila- enhancer von ze- 
ste (E(z)). Identische Aminosauren der konservierten 
carboxyterminalen SET-Domane (schattierte Box) und 
der Cys-reichen Region (Cys-Reste sind hervorgeho- 
ben) sind gezeigt. Die mutmaBlichen Kernlokalisie- 
rungssignale sind unterstrichen. 

Fig. 2 zeigt den Vergieich der Aminosaure-Sequenz 
zwischen dem humanen Homologen H3— 9 und Droso- 
phila-Su(var)3— 9. Identische Aminosauren der konser- 
vierten carboxyterminalen SET-Domane (schattierte 
Box) und der Chromo-Domane (dunkler schattierte 
Box) sind dargestellt. Die mutmaBlichen Kernlokalisie- 
rungssignale sind unterstrichen. Oben in der Figur ist 
eine schematische Obersicht der beiden Proteinstruktu- 
ren dargestellt, die zeigt, daB im humanen Homologen 
207 Aminosauren am N-Terminus fehlen. 

Da translationale Consensussequenzen in Umgebung 
des Start-ATG der humanen H3— 9-cDNA auch an der 
entsprechenden internen Position in Su(var)3— 9 vor- 
handen sind, durfte das Drosophila-Protein zusatzliche 
Exons enthalten, die in einem spateren Stadium der 
Evolution fur die Funktion entbehrlich wurden. (Die 
Richtigkeit dieser Hypothese kann bestatigt werden, in- 
dem die humane H3— 9-cDNA und komplette oder am 
5'-Ende verkurzte cDNAs von Su(var)3— 9 in Drosophi- 
la exprimiert werden. Es wurde eine weitere cDNA der 
Bezeichnung MG-44 beschrieben (s. unten), der eben- 
falls das S'-Ende fehlt) 

Im Rahmen der vorliegenden Erfindung durchgefuhr- 
te DNA-Blot-Analysen deuten darauf hin, daB HEZ und 
H3— 9 in der Maus von einzelnen Genen reprasentiert 
werden, wahrend im Menschen HEZ-Sequenzen durch 



zwei getrennte Loci kodiert werden. Der zweite HEZ- 
Locus (als HEZ-1 bezeichnet) wurde auch durch Cha- 
rakterisierung einer kleinen Anzahl von cDNA-Varian- 
ten, die sich in ihren 3'-flankierenden Sequenzen von der 
5 Mehrzahl der aus der humanen cDNA-Bibliothek iso- 
iierten HEZ-Klone unterscheiden, bestatigt Die Unter- 
schiede zwischen HEZ-2 und HEZ-1 im sequenzierten 
Bereich sind in Fig. 8 dargestellt: Die SET-Domane von 
HEZ-1 zeigt gegenuber HEZ-2 Mutationen; auBerdem 
io hat HEZ-1 in der SET-Domane ein Stopoodon, das das 
Protein um die 47 C-terminalen Aminosauren verkurzt 
In Fig. 8 ist die Nukleotidsequenz der HEZ-2-cDNA 
von Position 1844 bis 2330 in der jeweils oberen Zeile 
dargesteUt, wobei das authentische Stopcodon unter- 
15 strichen ist Um eine Teilsequenz der cDNA der HEZ- 
1-Variante der HEZ-2-Sequenz zuzuordnen, wurde das 
gap-Programm des Wisconsin GCG Netzwerkservice 
verwendet Das vorzeitige Stopcodon in HEZ-1 (Posi- 
tion 353) ist unterstrichen. Sequenzen, die fur die kon- 
20 servierte SET-Domane kodieren, sind hervorgehoben. 
AuBerdem ist das 3'-Ende (Position 151 in HEZ-1) des 
aberranten Transkripts B52 (s. unten) dargestellt Uber 
die verfugbare Sequenz zeigte sich B52 zu 97% iden- 
tisch mit HEZ-1 und zu 72% identisch mit HEZ-2. Der 
25 Sequenzvergleich von HEZ-1 mit HEZ-2 sowie die Fest- 
steliung, daB beim Menschen im Gegensatz zur Maus 
zwei getrennte HEZ-Loci auftreten, lassen darauf 
schlieBen, daB beim Menschen eine Genduplikation auf- 
getreten sein durf te. 
30 In einem Vergieich mit cDNA-Sequenzen in der Da- 
tenbank GeneBank wurde uberraschend festgestellt, 
daB bestiramte in der Datenbank eingetragene cDNA- 
Teilsequenzen, die von aberranten Transkripten in Tu- 
morgeweben abgeleitet sind, mutierte Versionen der er- 
35 findungsgemaBencDNAsdarstellen: 

Einerseits war auf der Suche nach BRCA1, einem 
Gen, das fur Brust- und Eileiterkrebs pradisponiert, eine 
partielle cDNA-Sequenz mit 271 Nukleotiden der Be- 
zeichnung B52, die fur eine mutierte Variante der SET- 
40 Domane kodiert, isoliert und auf dem humanen Chro- 
mosom 17q21 kartiert worden (Friedman et al., 1994). Es 
wurde im Rahmen der vorliegenden Erfindung uberra- 
schend festgestellt, daB B52 97% Identitat mit der erfin- 
dungsgemaBen HEZ- 1-cDN A- Variante aufweist (vgl 
45 oben); moglicherweise stellt HEZ-1 ein Pseudogen dar, 
dessen Reaktivierung bei der deregulierten Prolifera- 
tion eine Rolle spielt. 

Andererseits war eine cDNA (2500 Nukleotide; MG- 
44) vom humanen Chromosom Xpll isoliert worden 
50 (Geraghty et aL, 1993), einer Region, die fur degenerati- 
ve Storungen der Netzhaut und Synovialsarkome pra- 
disponiert Es wurde uberraschend festgestellt, daB die- 
se cDNA 98% Identitat mit der erfindungsgemaBen 
H3— 9-cDNA aufweist. (Der Sequenzvergleich der 
55 H3— 9-cDNA mit ihrer mutierten Version MG-44 zeigt, 
daB diese ebenfails nicht das am 5'-Ende gelegene GTP- 
Bindungsmotiv des Drosophila-Homologen aufweist) 

Die im Rahmen der vorliegenden Erfindung bereitge- 
stellten neuen Gene ermdglichen es somit erstmals, ei- 
60 nen Zusammenhang zwischen bestimmten Krebser- 
krankungen und Mutationen in Chromatinregulatoren 
herzuleiten; im Falle der MG-44-cDNA konnte, da diese 
mehrere Punkt- und Frameshift- Mutationen aufweist, 
welche die Chromo- und SET-Domanen unterbrechen, 
65 erst anhand der erfindungsgemaBen H3— 9-cDNA ein 
Zusammenhang zwischen Su(var)3— 9 und MG-44 auf- 
geklart werden. 

Neben den bereits genannten Sequenzen sind in der 
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Sequenzdatenbank GeneBank als weitere humane Mit- 
glieder der SET-Proteinfamilie das gut dokumentierte 
humane Homologe von Drosophila trx, HRX/ALL-1 
(Tkachuk et aL, 1992; Gu et at, 1992) eingetragen, ferner 
ein Gen unbekannter Funktion der Bezeichnung G9a, 
das im humanen Major Histocompatibility Complex 
(Milner und Campbell, 1993) vorhanden ist, drittens eine 
nicht publizierte cDNA (KG-1), die aus unreifen myeloi- 
den Tumorzellen isoliert wurde (Nomura et aL, 1994). 
Wahrend G9a derzeit das einzige humane Gen mit einer 
SET-Domane ist, fur das bisher keine mutierte Version 
bekannt ist, tragt KG-1 eine Insertion von 342 Amino- 
sauren, welche die SET-Domane in eine Amino- und 
eine Carboxyterminale Haifte spaltet Ob diese KG- 
1-cDNA das authentische Gen oder eine aberrante Ver- 
sion darstellt, ist unklar. Insgesamt sind vier der funf 
derzeit bekannten humanen Mitglieder der SET-Pro- 
teinfamilie Anderungen unterworfen, die alle die SET- 
Domane rnutieren (HRX/ALL-1, HEZ-1/B52, MG-44 
und KG-1). Daruberhinaus wurden in drei Fallen die 
entsprechenden humanen Genloci in der Nahe von 
Translokationsbruchpunkten oder instabilen chromoso- 
malen Regionen kartiert (HRX/ALL-1, HEZ-1/BS2 und 
MG-44). In Fig. 3 sind die aberranten Transkripte von 
humanen SET-Domane-Genen dargestellt Links in der 
Figur ist die Lage der funf derzeit bekannten SET-Do- 
mane-Gene auf dem jeweiligen Chromosom angegeben. 
LLa. sind die drei Gene (HRX/ALL-1, HEZ-1/B52 und 
MG-44), fur die aberrante cDNAs auf Translokations- 
bruchpunkten oder instabilen Chromatinregionen kar- 
tiert wurden, dargestellt Vier der funf dargestellten 
SET-Domane-Gene weisen Mutationen auf, die alle die 
Carboxyterminale SET-Domane unterbrechen, welche 
in der Figur durch die dunkle Box dargestellt ist Eine 
Translokation verbindet die aminoterminale Haifte von 
HRX mit einer nicht korrelierten Gensequenz, die als 
gepunktete Box mit der Bezeichnung ENL dargestellt 
ist Ein vorzeitiges Stopcodon verkurzt die SET-Doma- 
ne von HEZ-1/B52. Punkt- und Frameshift-Mutationen 
unterbrechen die Chromo- und SET-Domane in MG-44. 
Eine groBe Insertion spaltet die SET-Domane von 
KG-1 in zwei Half ten. Aberrante Transkripte sind der- 
zeit fur G9a nicht bekannt Das Cystein-reiche Cluster in 
B52 ist als gepunktete Box dargestellt; in HRX/ALL-1 
sind die Homologieregion zu Methyltransferasen als 
schraffierte Box und die A/T-Haken als vertikale Linien 
dargestellt Die Namen der jeweiligen authentischen 
Gene sind rechts in der Figur angegeben. 

Die Tatsache, daB ein Saugetiergen der SET-Protein- 
familie, HRX/ALL-1, mit translokationsinduzierter Leu- 
kamogenese im Zusammenhang gebracht wurde (Tka- 
chuk et aL, 1992; Gu et aL, 1992), ist ein starker Hinweis 
dafur, daB Proteine mit SET-Domane nicht nur wichtige 
Regulatoren der Entwicklung sind, die chromatinabhan- 
gige Veranderungen der Genexpression mitbestimmen, 
sondern daB sie, nach Mutation, auch die normale Zell- 
proliferation storen. 

Da alle bisher beschriebenen Mutationen die Primar- 
struktur der SET-Domane unterbrechen, liegt die Ver- 
mutung nahe, daB es die SET-Domane als solche ist, die 
eine entscheidende Rolle im Obergang vom normalen 
zum transformierten Zustand spieit Eine wichtige 
Funktion fiir die SET-Domane kann ferner aufgrund 
ihrer evolutionaren Konservierung in Genprodukten, 
die von der Hefe bis zum Menschen.auftreten, vermutet 
werden. 

Fig, 4 zeigt die evolutionare Konservierung von SET- 
Domane-Proteinen: Unter Verwendung des tfasta-Pro- 



gramms des Wisconsin GCG Netzwerkservice wurden 
Proteine und offene Leserahmen mit Homologie zur 
SET-Domane identifiziert In der Figur ist eine repre- 
sentative Auswahl von Hefe bis zum Menschen gezeigt 
5 Ziffern geben Aminosauren an. Die Carboxyterminale 
SET-Domane ist durch eine schwarze Box dargestellt, 
Cys-reiche Regionen durch eine dunkel gepunktete Box, 
das GTP-Bindungsmotiv in Su(var)3— 9 durch eine hell- 
gepunktete Box und die Chromo-Domane von 
io Su(var)3-9 und H3-9 durch eine offene Box mit hellen 
Punkten. Eine Region mit Homologie zu Methyltransfe- 
rase (trx und HRX) ist als schraffierte Box dargestellt 
A/r- w Haken w ("AJT Hooks") sind durch vertikale Linien 
dargestellt Eine weitere Ser-reiche Region (S in 
15 C26E6.10) und eine Glu-reiche Region (E in G9a) oder 
Ankyrin-Repeats (ANK in G9a) sind ebenfalis hervor- 
gehoben. YHR119 (GeneBank Accession No. U00059) 
und C26E6.10 (GeneBank Accession No. U 13875) sind 
offene Leserahmen von kurziich in die Datenbank ein- 
20 getragenen Cosmiden ohne eine funktionelle Charakte- 
risierung. Prozente geben die Gesamtheit der Amino- 
saure-Identitaten zwischen den humanen und den Dro- 
sophila- Pro teinen an. 
Fig. 5 zeigt die Obereinstimmung an Aminosauren 
25 der SET-Domane. Die SET-Domane der in Fig. 4 darge- 
stellten Gene wurde unter Verwendung des Pileup-Pro- 
gramms des Wisconsin GCG Netzwerkservice ange- 
ordnet Fur den Vergleich der KG-1 -SET-Domane wur- 
de vor dem Pileup die groBe Aminosaure-Insertion, die 
30 die SET-Domane in zwei Halften spaltet, entfernt Ami- 
nosaure-Positionen, die 8 von 10 Obereinstimmungen 
aufweisen, sind hervorgehoben. 

Aufgrund der im Rahmen der vorliegenden Erf indung 
festgestellten Kriterien erweist sich eine Beteiligung der 
35 Gene, die eine SET-Domane haben, an der chromatin- 
abhangigen Entstehung der deregulierten Proliferation; 
diese Gene bzw. die davon abgeleiteten cDNAs sowie 
Teil- und mutierte Sequenzen konnen somit bei der 
Therapie und Diag nose yon. Erkrankungen. die_auf_eine. 
40 derartige Proliferation zuruckzufiihren sind, eingesetzt 
werden: 

Unterschiede im Transkriptionsniveau von SET- Do- 
mane- RN As zwischen normalen und transformierten 
Zellen konnen als diagnostischer Parameter fur Erkran- 

45 kungen herangezogen werden, in denen die Expression 
von SET-Domane-Genen dereguliert ist: 

So konnen Oligonukleotide, kodierend fur die SET- 
Domane als solche bzw. Teilabschnitte davon, als dia- 
gnostischer Marker verwendet werden, urn bestimmte 

so Krebsarten, in denen die SET-Domane mutiert ist, zu 
diagnostizieren. Fur die detaillierte Analyse der Funk- 
tion der erfindungsgemaBen cDNAs oder Abschnitten 
davon im Hinblick auf den diagnostischen Einsatz von 
SET-Domane-Gensequenzen wurden im Rahmen der 

55 vorliegenden Erfindung die homologen Maus-cDNAs 
von HEZ-2 und H3— 9 isoliert Bei Verwendung der 
Maus-HEZ-cDNA als spezifische DNA-Sonde in "nu- 
clease SI protection" Analysen zur Untersuchung der 
HEZ-2-Genaktivitat wahrend der normalen Mausent- 

60 wicklung zeigte sich ein eher breites ExpressionsprofD, 
das ahnlich dem von bmi (Haupt et aL, 1991) ist Die mit 
den Maussequenzen durchgefuhrten Analysen werden 
mit Humansequenzen ausgeweitet, um die RNA-Men- 
gen zwischen unreifen Vorlauferzellen, Tumorzellen 

65 und differenzierten Zellen in verschiedenen humanen 
Zellkultursystemen zu vergleichen. Um festzustellen, ob 
sich die SET-Domane dementsprechend als diagnosti- 
scher Tumormarker fur spezifische Krebserkrankungen 
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oder als genereller diagnostischer Parameter eignet, 
kdnnen gangige Methoden zur Bestimmung der RNA- 
Konzentration, die in einschlagigen Laborhandbuchern 
(Sambrook, J, Fritsch, ELF. und Mania tis, T., 1989, Cold 
Spring Harbor Laboratory Press) beschrieben sind, wie 
Northern Blot, Sl-Nuclease-Protection- Analyse oder 
RNAse- Protection- Analyse, verwendet werden. 

Urn die Haufigkeit zu untersuchen, mit der die SET- 
Domane spezifischen Mutationen unterliegt, konnen die 
SET-spezifischen DNA-Sonden zur Analyse von Einzel- 
strang-Konformationspolymorphismen (single strand 
conformation polymorphisms; SSCP; Gibbons et aL, 
1995) eingesetzt werden. 

Krebsarten, bei denen SET-spezifische DNA-Sonden 
als diagnostischer Marker verwendet werden k5nnen, 
sind Brustkrebs (HEZ-2; Friedman et al., 1994), Synovi- 
alksarkom (H3— 9; Geraghty et aL; 1993) und Leuka- 
mien. 

Aufgrund der Kenntnis der Nukleotidsequenz der 
SET-Domane-Gene konnen die entsprechenden von 
der cDNA-Sequenz abgeleiteten Proteine, die ebenfalls 
Gegenstand der vorliegenden Erfindung sind, in rekom- 
binanter Form herstellt werden, indem die dafur kodie- 
renden cDNAs in geeignete Vektoren inseriert und in 
Wirtsorganismen exprimiert werden. Die fur die Pro- 
duktion rekombinanter Proteine verwendeten Techni- 
ken sind dem Durchschnittsfachmann gelaufig und kon- 
nen einschlagigen Handbuchern (Sambrook, J, Fritsch, 
E.F. und Maniatis, T, 1989, Cold Spring Harbor Labora- 
tory Press) entnommen werden. 

Gegenstand der vorliegenden Erfindung sind somit in 
einem weiteren Aspekt rekombinante DNA-Molekule, 
enthaltend die fur HEZ-2, H3— 9 oder HEZ-1 kodieren- 
de DNA sowie damit funktionell verbundene Expres- 
sionskontrollsequenzen, sowie die damit transformier- 
ten Wirtsorganismen. 

Die erfindungsgemaBen rekombinanten Proteine 
konnen eingesetzt werden, urn die Wechselwirkung von 
SET-Domane-Proteinen mit Chromatin bzw. mit ande- 
ren Mitgliedern von Heterochromatinkomplexen zu 
analysieren; ausgehend von den dabei erhaltenen Er- 
kenntnissen uber die Wirkungsweise dieser Komplexe 
werden die sich im einzelnen ergebenden Moglichkeiten 
fiir das gezielte Eingreifen in die daran beteiligten Me- 
chanismen definiert und konnen fur therapeutische An- 
wendungen genutzt werden. 

Untersuchungen, die der weiteren Analyse der Funk- 
tion der SET-Domane dienen, werden z. B. durchge- 
fuhrt, indem cDNAs, kodierend fur humanes HEZ-2 
bzw. H3— 9 und versehen mit einem Epitop, gegen das 
Antikorper zur Verfugung stehen, in vitro sowie in Ge- 
webekulturen exprimiert werden. Nach Immunprazipi- 
tation mit den jeweiligen epitopspezifischen Antikor- 
pern kann festgestellt werden, ob HEZ-2 und H3— 9 
miteinander in vitro wechselwirken kdnnen und ob in 
vivo eine Komplexbildung zwischen HEZ-2 und/oder 
H3— 9 mit weiteren Chromatinregulatoren stattfindet 

Es wurde bereits von anderen Autoren angenommen 
(DeCamillis et aL, 1992; Rastelli et aL, 1993; Orlando und 
Paro, 1993), daB eine Komplexbildung zwischen ver- 
schiedenen Mitgliedern von Heterochromatinproteinen 
wesentlich fur deren Funktion ist Aufgrund der Verfug- 
barkeit der erfindungsgemaBen SET- Do mane-Gene 
kann festgestellt werden, ob die SET-Region eine Do- 
mane darstellt, die aufgrund von Wechselwirkungen 
funktioniert, oder ob sie zum Entstehen multimerer he- 
terochromatischer Komplexe beitragt Ebenso kann 
festgestellt werden, ob die SET-Domane eine inhibitori- 



sche Funktion hat, ahnlich der aminoterminalen BTB- 
Dornane verschiedener Chromatinregulatoren, ein- 
schliefllich des GAGA-Faktors (Adams et aL, 1992). Ins- 
gesamt erlauben die Analysen von Wechselwirkungen 
5 mit Epitop-versehenen HEZ-2- und H3— 9-Proteinen 
eine weitere Charakterisierung der Funktion der SET- 
Domane. Dadurch werden Mdglichkeiten eroffnet, ge- 
gen die deregulierte Aktivitat vorzugehen, indem z. B. 
mitteis gentherapeutischer Methoden dominant-negati- 
io ve Varianten der SET-Domane-cDNA-Sequenzen in 
die Zelle eingefiihrt werden. Deraruge Varianten wer- 
den z. B. erhalten, indem zunachst die funktionellen Do- 
manen der SET- Proteine definiert werden, z. B. die fur 
die DNA/Chromatin- oder die fur die Protein/Protein- 
15 Wechselwirkung verantwortlichen Sequenzabschnitte, 
und indem dann die um die jeweilige(n) Domane(n) oder 
urn Abschnitte davon verkurzten DNA-Sequenzen in 
der betroffenen Zelle zur Expression gebracht werden, 
um eine durch das intakte funktionelle Protein verur- 
20 sachte Deregulation der Proliferation zu kompetitieren. 
Die Verfugbarkeit der erfindungsgemaBen cDNAs 
erlaubt ferner die Herstellung transgener Tiere, z. B. 
Mause, in denen SET-Domane-Gene entweder uberex- 
primiert werden konnen ( w gain-of-function^ oder in de- 
25 nen diese Gene ausgeschaltet werden k6nnen ("loss-of- 
function"); fur letztere Analysen werden die korrespon- 
dierenden Tiersequenzen, insbesondere Maussequen- 
zen, der erfindungsgemaBen Gene eingesetzt. 

Insbesondere gibt die °gain-of -function'*- Analyse, bei 
30 der Allele der erfindungsgemaBen Gene in die Maus 
eingefiihrt werden, letztlich AufschluB iiber die ursachli- 
che Beteiligung von HEZ-2 und H3— 9 an der chroma- 
tinabhangigen Fdrderung der Tumorentstehung. Fur 
die "gain-of-function M -Analyse kCnnen die kompletten 
35 cDNA-Sequenzen von humanem HEZ-2 und H3— 9 so- 
wie deren mutierte Versionen, wie HEZ-1/B52 und MG- 
44, mitteis Vektoren, die hohe Expressionsraten ermog- 
lichen, z. B. Plasmiden mit dem humanen P-Actin-Pro- 
motor, getrieben sowoh] vom Enhancer der schweren 
40 Kette von Immunglobulinen (Eu.) als auch von Moloney- 
Virus-Enhancern (Mo-LTR). Kurzlich wurde gezeigt, 
daB die EuyMo-LTR-abhangige Oberexpression des 
bmi-Gens, welches gemeinsam mit HEZ-2 zur Pc-Grup- 
pe negativer Chromatinregulatoren zahlt, ausreicht in 
45 transgenen Mausen Lymphome zu erzeugen (Alkema et 
aL,1995). 

Indem in "loss-of-function w -AnaIysen die endogenen 
Maus- Loci fiir HEZ-2 und H3— 9 durch homologe Re- 
kombination in embryonalen Stammzellen unterbro- 

50 chen werden, kann bestimmt werden, ob der Verlust der 
in vivo-Genfunktion zu einer abnormalen Entwicklung 
der Maus fuhrt. 

Aufgrund dieser in vivo-Systeme kann die Wirkung 
von HEZ-2 und H3— 9 bestatigt werden; diese Systeme 

55 dienen aufierdem als Grundlage furTiennodelle im Hin- 
blick auf eine humane Gentherapie. 

Der gentherapeutische Einsatz der erfindungsgema- 
Ben DNA-Sequenzen oder davon abgeleiteter Sequen- 
zen (z.B. komplementSrer Antisenseoligonukleotide) 

60 erfolgt — je nachdem, ob die zu behandelnde Erkran- 
kung auf eine Deregulation von Chromatin infolge des 
Fehlens der funktionellen Gensequenz, oder aber infol- 
ge einer Oberexpression der entsprechenden Gene oder 
durch Reaktivierung eines Pseudogens zuruckzufuhren 

65 ist — durch Einfiihrung der funktionellen Gensequenz, 
durch Inhibierung der Genexpression, z. B. mit Hilfe von 
Antisenseoligonukleotiden, oder durch Einfiihrung ei- 
ner fur eine dominant-negative Mutante kodierenden 
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Sequenz. Die Einfuhrung der jeweiligen DNA-Sequen- 
zen in die Zelle kann mit Hilfe von Standardmethoden 
fur die Transfektion hoherer eukaryotischer Zellen er- 
folgen, zu denen der Gentransfer mittels viraler Vekto- 
ren (Retrovirus, Adenovirus, Adeno-assoziiertes Virus) 
oder mittels nicht-viralen Systemen auf Basis der Re- 
zeptor-vermittelten Endozytose zahlen; Obersichten 
uber gebrauchliche Methoden werden z. B. von Mitani 
und Caskey, 1993; Jolly, 1994; Vile und Russel, 1994; 
Tepper und Mule, 1994; Zatloukal et aL, 1993, 
WO 93/07283 gegeben. 

Fiir eine Inhibierung der Expression der erfindungs- 
gemaBen Gene kommen auch niedermolekulare Sub- 
stanzen in Betracht die in die Transkriptionsmaschine- 
rie eingreifen; nach Analyse der 5'-regulatorischen Re- 
gion der Gene kann nach Substanzen gescreent werden, 
die die Wechselwirkung der jeweiligen Transkriptions- 
faktoren mit dieser Region ganz oder teilweise blockie- 
ren, z. B. mit Hilfe der in der Wo 92/13092 beschriebe- 
nen Methode. 

Eine Inhibierung der deregulierten Proliferation kann 
auch am Genprodukt ansetzen, indem die entsprechen- 
den Antikorper gegen das HEZ-2- oder H3— 9-Protein, 
vorzugsweise humane oder humanisierte Antikorper, 
therapeutisch eingesetzt werden. Die Herstellung sol- 
cher Antikorper erfolgt nach bekannten Methoden, wie 
sie z. B. von Malavsi und Albertini, 1992, oder von Rhein, 
1 993, beschrieben wurden. 

Antikorper gegen HEZ-2 oder H3— 9, die therapeu- 
tisch oder diagnostisch verwendet werden konnen, sind 
ebenfalls Gegenstand der vorliegenden Erfindung. 

Figurenubersicht 

Fig. 1 Aminos&ure-Sequenzvergleich zwischen 
HEZ-2 und E(z), 

Hg. 2 Aminosaure-Sequenzvergleich zwischen 
H3— 9 und Su(var)3-9, 

Fig. 3 Aberrame T r ansk ripte von tramanen SET-Do- 
mane-Genen, 

Fig. 4 Evolutionare Konservierung von SET-Doma- 
ne-Proteinen, 

Fig. 5 Aminosaure-Obereinstimmung in der SET- Do- 
mane, 

Fig. 6 DNA-Sequenz von HEZ-2, 
Fig. 7 DNA-Sequenz von H3— 9, 
Fig. 8 Sequenzvergleich zwischen den cDNAs von 
humanem HEZ-2 und REZ-1. 

Beispiel 

a) Herstellung einer cDNA-Bibliothek 

Es wurde eine humane B-Zell-spezifische cDNA-Bi- 
bliothek, wie von Bardwell und Treisman, 1994, be- 
schrieben, hergestellt, indem Poly(A) + -RNA aus huma- 
nen BJA-B-Zellen isoliert, mittels Poly(dT)i5-Primingre- 
vers transkribiert und in doppelstrangige cDNA kon- 
vertiert wurde. Nach Zugabe eines EcoRI-Adapters der 
Sequenz 5' AATTCTCGAGCTCGTCGACA wurde die 
cDNA in die EcoRI-Stelle des Bakteriophagen XgtlO 
ligiert. Die Propagierung und Amplifizierung der Bi- 
bliothek erfolgte in Ecoli C600. 

b) Herstellung von DNA-Sonden 

Drosophila-DNA-Sonden, kodierend fur die konser- 
vierten SFT-Domanen von E(z) und Su(var)3— 9, wur- 
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den auf der Gmndlage der publizierten Drosophila-Se- 
quenzen (Jones und Gelbart, 1993; Tschiersch et aL, 
1994) mittels Polymerasekettenreaktion (PCR) herge- 
stellt: 1 u.g von Drosophila meianogaster-DNA (Clon- 
5 tech) wurde mit den beiden Primern E(z) 1910 (5' ACT- 
GAATTCGGCTGGGGCATCTTTCTTAAGG) und E( 
z) 2280 (5' ACTCTAGACAATTTCCATTT- 
CACGCTCTATG) einer PcR-Amplifikation (35 Zyklen 
zu 30 sek bei 94° C, 30 sek bei 55° C und 30 sek bei 72° C) 

to unterworfen. Die entsprechende SET- Domane- Sonde 
fur Su(var)3— 9 wurde von lOng Plasmid-DNA 
(Tschiersch et aL, 1994; KJon M4) mit dem Primerpaar 
suvar.up (5' ATATAGTACTTCAAGTCCATTCAA- 
AAGAGG) und suvandn (5' 

is CCAGGTACCGTTGGTGCTGTTTAAGACCG) am- 
piifiziert, wo bei dieselben Zyklusbedingungen verwen- 
det wurden. Die erhaltenen SET-Domane-DNA-Frag- 
mente wurden Gel-gereinigt und teilsequenziert, um die 
Richtigkeit der amplifizierten Sequenzen zu bestatigen. 

20 

c) Screenen der cDNA-Bibliothek 

5 x 10 s Plaque-bildende Einheiten ("plaque forming 
units", pfu) wurden mit 5 ml Kultur des bakteriellen 

25 Wirtsstammes Ecoli C600 (bei einer optischen Dichte 
OD«k> von 0.5 in 10 mM MgS0 4 suspendiert) bei 37° C 
15 min lang inkubiert und dann auf eine groBe (200 mm 
x 200 mm) vorgewarmte LB-Schale ausgegossen. Nach 
Wachstum uber Nacht bei 37° C wurden die Phagen auf 

30 einer Nylonmembran (GeneScreen) absorbiert Die 
Membran wurde, die Seite mit den absorbierten Phagen 
nach oben schauend, 30 sek lang in Denaturierungslo- 
sung (1^ M NaCl, 0^ M NaOH) schwimmen gelassen, 
dann 60 sek in Denaturierungslosung eingetaucht und 

35 abschlieBend 5 min lang in 3 M NaCl, 03 M Tris pH 8, 
neutralisiert Dann wurde die Membran kurz in 3 x SSC 
gespult und die Phagen-DNA mittels UV-Vernetzung 
auf das Nylonfilter fixiert Das Filter wurde 30 min lang 
bei 50°C in 30 ml Church-Puffer (1% BSA, 1 mM EDTA 

40 und 0.5 M NaHP0 4 , pH 72) prahybridisiert, anschiic- 
Bend wurden 2 x 10 6 cpm der radioaktiv markierten 
DNA-Sondenmischung (E(z)-SET und 

Su(var)3— 9-SET) zugegeben; die DNA-Sonden wurden 
durch Random-priming unter Verwendung des RediPri- 

45 me-Kit (Amersham) hergestellt. Die Hybridisierung 
wurde uber Nacht bei 50° C durchgefuhrt. Nach Entfer- 
nung der Hybridisierungsldsung wurde das Filter 10 sek 
in 2xSSC, 1% SDS bei Raumtemperatur gewaschen, 
anschlieBend wurde 10 sek lang bei 50° C gewaschen. 

so Das Filter wurde in Saranwrap gewickelt und unter 
Verwendung einer Verstarkerfolie der Autoradiogra- 
phic unterworfen. 

Positive Phagenkolonien wurden auf der Original- 
platte mittels Zuordnung des Autoradiogramms identi- 

55 fiziert und die entsprechenden Agarstuckchen mit dem 
grofieren Ende einer Pasteur- Pipette entfernt Der Pha- 
gen-Pool wurde uber Nacht bei 4°C in 1 ml SM-Puffer 
(5,8 g NaCl, 2g MgS0 4 -H 2 0, 50 ml Tris pH 75, 5 ml 
2%ige Gelatine auf 1 1 H 2 OX enthaltend einige Tropfen 

60 CHCb, eluiert Das Phagenlysat wurde fur eine zweite 
und dritte Screeningrunde wieder ausplattiert um ein- 
zelne, gut isolierte positive Plaques (20 bis 100 Plaques 
pro Platte in der dritten Runde) zu erhalten. 

65 d) Sequenzanalyse 

Die cDNA-Inserts von rekombinanten Phagen wur- 
den in den Polylinker von pBluescript KS (Stratagene) 
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subkloniert und auf einem automatischen Sequenzer 
(Applied Biosystems) unter Verwendung der Didesoxy- 
Methode sequenziert. Die komplette Sequenz von we- 
nigstens zwei unabhangigen Isolaten pro erhaltenen 
Gen wurde mittels "Primer walking" ermittelt Die Se- 5 
quenzen wurden mil dem GCG-Software-Paket (Uni- 
versity of Wisconsin) analysiert, die Untersuchung auf 
Homologie wurde mit dem "Blast and fasta" oder "tfa- 
sta" Netzwerkservice durchgefuhrt Die kompletten Se- 
quenzen von HEZ-2 und H3— 9 sind in Fig. 6 und 7 10 
dargestellt 
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Patentanspruche 

1. DNA-Molekule, enthaltend eine fur ein Chro- 
matinregulator-Protein, das eine SET-Domane auf- 
weist, kodierende Sequenz oder eine Teilsequenz 65 
davon, dadurch gekennzeichnet, daB sie die in 
Fig. 6, Fig. 7 oder Fig. 8 dargestellte Nukleotidse- 
quenz, kodierend fur HEZ-2, H3— 9 oder HEZ-1, 
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einschlieBlich ihrer degenerierten Varianten sowie 
Mutanten davon, enthalten. 

2. DNA-Molekul nach Anspruch 1, dadurch ge- 
kennzeichnet, daB es eine cDNA ist 

3. DNA-Molekiil nach Anspruch 1 oder 2, dadurch 
gekennzeichnet, daB es humanen Ursprungs ist 

4. cDNA nach Anspruch 3 der Bezeichnung HEZ-2. 

5. cDNA nach Anspruch 3 der Bezeichnung H3— 9. 

6. DNA-Molektil nach Anspruch 4, dadurch ge- 
kennzeichnet, daB es die fur die SET-Domane von 
HEZ-2 kodierende Region oder einen Abschnitt 
davon enthalt 

7. DNA-Molekul nach Anspruch 5, dadurch ge- 
kennzeichnet, daB es die fur die SET-Domane 
H3— 9 kodierende Region oder einen Abschnitt da- 
von enthalt 

8. DNA-Molekul nach Anspruch 4, dadurch daB es 
fOr eine dominant- negative Mutante von HEZ-2 
kodiert. 

9. DNA-Molekul nach Anspruch 4, dadurch daB es 
fur eine dominant-negative Mutante von H3— 9 ko- 
diert. 

10. Rekombinantes DNA-Molekul, enthaltend eine 
in Anspruch 2 definierte cDNA, funktionell verbun- 
den mit Expressionskontrollsequenzen, zur Expres- 
sion in prokaryotischen oder eukaryotischen Wirts- 
organismen. 

11. Prokaryotische oder eukaryotische Wirtsorga- 
nismen, transformiert mit rekombinanter DNA 
nach Anspruch 10. 

12. Rekombinantes humanes Chromatinregulator- 
Protein HEZ-2 oder ein Abschnitt davon, erhaltlich 
durch Expression einer in Anspruch 4 definierten 
cDNA. 

13. Rekombinantes humanes Chromatinregulator- 
Protein H3— 9 oder ein Abschnitt davon, erhaltlich 
durch Expression einer in Anspruch 5 definierten 
cDNA. 

14. Antikorper gegen HEZ-2. 

1 5. Antikorper gegen H3 — 9. 

16. Antisense(desoxy)ribonukleotide mit Komple- 
mentaritat zu einer Teilsequenz einer in Anspruch 
1 definierten DNA. 

17. DNA-Molekul, kodierend fur die SET-Domane 
eines Chromatinregulator-Gens, bzw. fur einen Ab- 
schnitt davon, zur Behandlung und Diagnose von 
Erkrankungen des Menschen, die auf eine Deregu- 
lation von Chromatinregulator-Genen, die eine 
SET-Domane aufweisen, zuruckzufuhren sind. 

18. DNA-Molekul nach Anspruch 6 oder 7 zur Be- 
handlung und Diagnose von Erkrankungen des 
Menschen, die auf eine Deregulation von Chromat- 
inregulator-Genen, die eine SET-Domane aufwei- 
sen, zuruckzufuhren sind. 

19. Antikorper nach Anspruch 14 oder 15 zur Be- 
handlung und Diagnose von Erkrankungen des 
Menschen, die auf eine Deregulation von Chromat- 
inregulator-Genen, die eine SET-Domane aufwei- 
sen, zuruckzufuhren sind. 

20. Transgene Maus, enthaltend ein Transgen fur 
die Expression eines Chromatinregulator-Gens, das 
eine SET-Domane aufweist, oder einer mutierten 
Version eines solchen Proteins. 

21. Transgene Maus, erhaltlich aus embryonalen 
Stammzellen, in denen die endogenen Maus-Loci 
fur HEZ-2 und H3— 9 durch homologe Rekombi- 
nation unterbrochen wurden. 

22. Verfahren zum Identifizieren von Saugetier- 
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Chromatinregulator-Genen, die eine SET- Do mane 
aufweisen, oder mutierten Versionen davon, da- 
durch gekennzeichnet, daB man Saugetier-cDNA- 
oder genomische DNA-Bibliotheken unter Bedin- 
gungen niedriger Stringenz mit einem DNA-Mole- 
kul, kodierend fur die SET-Domane pder einen Ab- 
schnitt davon, hybridisiert 
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Fig. 5 



E(z) SDIAGSGIFL KEGAQKNEFI SEYCGEIXSQ DEADRRGKVlC DK..YMCSFL 5C 

KEZ SDVAGWGIFI KDPVQKNEFI SEYCGEIXSQ DEMRRGKVY DK..YMCSFL 

KRX SPIHGRGLFC KRNIDAGEMV IE^c^VXRS IQTDKREKYY DSK3IG.CYM 

trx SHIHGRGLYC TKDIEAGEMV ll^L&S TLEPKRERYX DSRGIG.CYM 

C26 SRIHGWGLYA MESIAPDEMI VE&GpTXRS LV&E^EKA^ ERRGIGSSYL 

YHR S AI HfcTWGI* YA LDSIAAXEMI I ESEVGERIRQ PVxkMREKRS LKNSIGSSYL 

k i III 111 

su3-9 ANGSG8GVRA ATALRKGEFV CE^ESIXTS DEANEKGKAY; DDKG..RTYL 

H3-9 DDGRG*K3VRT LEKIRKNSFV ME^GEIJgTS EE A£RKGQ E3§ DRQG. . ATYL 

G9a TAKMG^^RA LQTIPQGTFI cixV&lJySD AEW)J.V.| .RED..DSYL 

KG-1 TQNK$W$:iRC LDDIAKGSFV CX^AGKIOTD D F AD KEG L . .EMG..DEYF 



E ( z ) i^Lg 

KEZ 

KRX pRID 

trx Skis 

C2 6 fRID 

YHR SRVD 

Su3-9 FPLdYNTAQD 

K3-9 FpLDY . . .VZ 

G9a FDLDNK.. DG 

KG-1 > &TC&iI..ES 



NDFWDAIRK ^NKIK|AN||^ 
NDFWt)£TRK ^iKIREAKftS 

^ IS I 111 

: :: 

D S EWDATMH GMRARET &HS 
DNLWOATMR GNAARF I NHC 
LHHVIDATKR %NFAI^I^S 
ENTVIDATKK ^IAR2FI|psfc 

SEYTIDAANY GNISHFlMjS 

DVYTVDAAYY ^ISHEVjiftb 

ZVYCIDARYY GNISREINHL 
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trx Hllllikvi^ VQ^^TY^ ..KFPFE.D. . EKIPCSCGS KRCRKYLN* 

C26 R/iyiySRTii KKGEEXTYira . .KFPIE DDKIDCLCGA KTCRGYLN* 

yhr riI^iyaiJeki aaseelt ySy! . .KFEREKDD EERLPCLCGA PNCKGFLN* 
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G9a RXAF^jsSRDl RTGSELG FDji£ GDRFW. .DIK S KYFTCQCGS EKCKHSAEAI 

KG-1 WVAFFA5KR2 RAGT EiC WD Y N'YEVG . . SVE GKE LLCCCGA IZ3R 
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ZEJCHNUNGEN SEJTE 6 



Nummer: 
Int. CI. 6 : 

Offenlegungstag: 



DE 195 16 776 A1 
C12N 15/11 

14. November 1996 



Fig. 6/1 

HEZ-2 Length: 2 607bp (CODING: 90-2330) 



1 


AGGCAG^GGA 


GCCCCGGCGG 


CGGCGGCGGC 


GGCGGGCGGG GGCGACGCGC 

M 

AGAATAATCA TGGGCCAGAC 


51 


GGGAAC AACG 


CGAGTCGGCG 


CGCGGGACGA 


101 


Tf^GG AA C AAA 


TCTGAGAAGG 


GACCAGTTTG 


TTGGCGGAAG 


CGTGTAAAAT 


1 Jl 




GrGACTGAGA 


CAGCTCAAGA 


GGTTCAGACG 


AGCTGATGAA 




r;TA A A CI Af^T A 


T^TTT AP-TTP 

X w XXX X X 


PAATPf^TPAG 


AAAATTT TGG 


AAAGAACGGA 




A 1TPTT A A AP 


C A AfZA ATCCA 


A AP AP,Pf^AA£S 


GATACAGCCT 


GTGCACATCC 




1 lj AL 1 1 w I V3 1 


bAbLlLAl lb 


\— oL. <JV3 AL- X A 


GGGAGTGTTC 


GGTGACCAGT 


OCT 

351 


GACTTGGATT 


TTCCAACACA 


is rTf t\ T*r m r m /~ m is. 


TTAAAGACTC 


TGAATGCAGT 


401 


TGCTTCAGTA 


CCCATAATGT 


ATTCTIVab 


TCCCCTACAG 


CAGAATTTTA 


451 


TGGTGGAAGA 


TGAAACTGTT 


TTACATAACA 


TTCCTTATAT 


GGG AG AT GAA 


501 


GTTTTAGATC 


AGGATGGTAC 


TTTCATTGAA 


GAACTAATAA 


AAAATTATGA 


551 


TGGGAAAGTA 


CACGGGGATA 


GAGAATGTGG 


GTTTATAAAT 


GA7GAAA7TT 


601 


TTGTGGAGTT 


GGTGAATGCC 


CTTGGTCAAT 


ATAATGAT G A 


TG AC GAT GAT 


651 


G ATG AT GG AG 


ACGATCCTGA 


AGAAAGAGAA 


GAAAAGCAGA 


AAGATCTGGA 


701 


GGATCACCGA 


GATGATAAAG 


AAAGCCGCCC 


ACCTCGGAAA 


TTTCCTTCTG 


751 


ATAAAATTTT 


TGAAGCCATT 


TCCTCAATGT 


TTC C AG AT AA 


GGGCACAGCA 


801 


GAAGAACTAA 


AGGAAAAATA 


TAAAGAACT C 


ACCGAACAGC 


AGCTCCCAGG 


851 


CGCACTTCCT 


CCTGAATGTA 


CCCCCAACAT 


AGATGGACCA 


AATGCTAAAT 


901 


CTGTTCAGAG 


AGAGCAAAGC 


TTACACTCCT 


TTCATACGCT 


TTTCTGTAGG 


951 


CGATGTTTTA 


AATATGACTG 


CTTCCTACAT 


CCTTTTCA7G 


CAACACCCAA 


1001 


CACTTACAAG 


CGGAAGAACA 


CAGAAACAGC 


T CT AG AC AAC 


AAACC TTGTG 


1051 


GACCACAGTG 


TTACCAGCAT 


TTGGAGGGAG 


CAAAGGAGTT 


TGCTGCTGCT 


1101 


CTCACCGCTG 


AG CGG AT AAA 


GACCCCACCA 


AAACGTCCAG 


GAGGCCGCAG 


1151 


AAGAGGACGG 


CTTCCCAATA 


ACAGTAGCAG 


GCCCAGCA" 


CCCACCA7TA 


1201 


ATGTGCTGGA 


ATCAAAGGAT 


ACAGACAGTG 


ATAGGGAAGC 


AGGGAC7GAA 


1251 


AC GGGGGG AG 


AGAACAATGA 


TAAAGAAGAA 


. GAAGAGAAGA 


AAGATGAAAC 


1301 


TTCGAGCTCC 


TCTGAAGCAA 


ATTCTCGGTG 


TCAAACACCA 


ATAAAGA7GA 




AGCCAAA7A7 


7GAA7CTCCT 


GAGAATGTGG 


AGTGGAG733 


TG77GAA3CC 
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ZEICHNUNGEN SEITE 7 



Nummer: DE 195 16 776 A1 

Int. CI. 6 : C12N 15/11 

Offeniegungstag: 14. November 1996 



Fig. 6/2 



14 01 TCAATGTTTA GAGTCCTCAT TGGCACTTAC TATGACAATT TCTGTGCCAT 

14 51 TGCTAGGTTA ATTGGGACCA AAACATGTAG ACAGGTGTAT GAGTTTAGAG 

1501 TCAAAGAATC TAGCATCATA GCTCCAGCTC CCGCTGAGGA TGTGGATACT 

1551 CCTCCAAGGA AAAAGAAGAG GAAACACCGG TTGTGGGCTG C AC AC TGC AG 

1601 AAAG AT AC AG CTGAAAAAGG ACGGCTCCTC TAACCATGTT TACAACTATC 

1651 AACCCTGTGA T CAT CC AC GG CAGCCTTGTG ACAGTTCGTG CCCTTGTGTG 

1701 ATAGCACAAA ATTTTTGTGA AAAGTTTTGT CAATGTAGTT CAGAGTGTCA 

17 51 AAACCGCTTT CCGGGATGCC GCTGCAAAGC ACAGTGCAAC ACCAAGCAGT 

1801 GCCCGTGCTA CCTGGCTGTC CGAGAGTGTG ACCCTGACCT CTGTCTTACT 

1851 TGTGGAGCCG CTGACCATTG GGACAGTAAA AATGTGTCCT GCAAGAACTG 

1901 CAGTATTCAG CGGGGCTCCA AAAAGCATCT ATTGCTGGCA CCATCTGACG 

1951 TGGCAGGCTG GGGGATTTTT ATCAAAGATC CTGTGCAGAA AAATGAATTC 

2001 ATCTCAGAAT ACTGTGGAGA GATTATTTCT CAAGATGAAG CTGACAGAAG 

2051 AGGGAAAGTG TATGATAAAT ACATGTGCAG CTTTCTGTTC AACTTGAACA 

2101 ATGATTTTGT GGTGG AT GC A ACCCGCAAGG GTAACAAAAT TCGTTTTGCA 

2151 AATCATTCGG TAAATCCAAA CTGCTATGCA AAAGTTATGA TGGTTAACGG 

2201 TGATCACAGG ATAGGTATTT TTGCCAAGAG AGCCATCCAG ACTGGCGAAG 

2251 AGCTGTTTTT T GAT T AC AG A TACAGCCAGG CTGATGCCCT GAAGTATGTC 

2301 GGCATCGAAA GAGAAATGGA AATCCCT TGA CATCTGCTAC CTCCTCCCCC 

2351 TCCTCTGAAA CAGCTGCCTT AGCTTCAGGA ACCTCGAGTA CTGTGGGCAA 

24 01 TTTAGAAAAA GAACATGCAG TTTGAAATTC TGAATTTGCA AAGTACTGTA 

2 4 51 AGAATAAT™ ATAGTAATGA GTTTAAAAAT CAACTTTTTA TCGCC7TCTC 

2501 ACCAGCTGCA AAGTGTTTTG TACCAGTGAA TTTTTGCAAT AATGCAGTAT 

2551 GGTACATTTT TCAACTTTGA AT AAAG AAT A CTTGAACTTG TCAAAAAAAA 

2 601 TGTCGAC 
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ZE1CHNUNGEN SEfTE 8 



Nummer: 
Int. Cl.6 : 

Offenlegungstag: 



OE 195 16 776 AT 
C12IM 15/11 
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Fig, 7/1 



H3-9 LENGTH: 2747bp (CODING: 53-1291) 



1 


GTCGACACTC 
M 

AGATGGCGGA 


GCGAGGCCGG 


CTAGGCCCGA 


ATGTCGTTAG 


CCGTGGGGAA 


51 


AAATTTAAAA 


GGCTGCAGCG 


TGTGTTGCAA 


GTCTTCTTGG 


101 


AATCAGCTGC 


AGGACCTGTG 


CCGCCTGGCC 


AAGCTCTCCT 


GCCCTGCCCT 


151 


CGGTATCTCT 


AAGAGGAACC 


TCTATGACTT 


TGAAGTCGAG 


TACCTGTGCG 


201 


ATTACAAGAA 


GATCCGCGAA 


CAGGAATATT 


ACCTGGTGAA 


ATGGCGTGGA 


251 


TATCCAGACT 


CAGAGAGCAC 


CTGGGAGCCA 


CGGCAGAATC 


TCAAGTGTGT 


301 


GCGTATCCTC 


AAGCAGTTCC 


ACAAGGACTT 


AGAAAGGGAG 


CTGCTCCGGC 


351 


GGCACCACCG 


GTCAAAGACC 


CCCCGGCACC 


TGGACCCAAG 


CTTGGCCAAC 


401 


TACCTGGTGC 


AGAAGGCCAA 


GCAGAGGCGG 


GCGCTCCGTC 


GCTGGGAGCA 


451 


GGAGCTCAAT 


GCCAAGCGCA 


GCCATCTGGG 


ACGCATCACT 


GTAGAGAATG 


501 


AGGTGGACCT 


GGACGGCCCT 


CCGCGGGCCT 


TCGTGTACAT 


CAATGAGTAC 


551 


CGTGTTGGTG 


AGGGCATCAC 


CCTCAACCAG 


GTGGCTGTGG 


GCTGCGAGTG 


601 


CCAGGACTGT 


CTGTGGGCAC 


CC ACT GGAGG 


CTGCTGCCCG 


GGGGCGTCAC 


651- 


T GC AC AA.GT T 


- TGGG-TAGAAT- 


-GAOOAGGGGC 


AGGTGCGGGT- 


TOGAGC-CGGG 


701 


CTGCCCATCT 


ACGAGXGCAA 


CTCCCGCTGC 


CGCTGCGGCT 


ATGACTGCCC 


751 


AAATCGTGTG 


GTACAGAAGG 


GTATCCGATA 


TGACCTCTGC 


ATCTTCCGGA 


801 


CGGATGATGG 


GCGTGGCTGG 


GGCGTCCGCA 


CCCTGGAGAA 


GATTCGCAAG 


851 


AACAGCTTCG 


TCATGGAGTA 


CGTGGGAGAG 


ATCATTACCT 


CAGAGGAGGC 


901 


AGAGCGGCGG 


GGCCAGATCT 


ACGAC CGTCA 


GGGCGCCACC 


TACCTCTTTG 


951 


ACCTGGACTA 


CGTGGAGGAC 


GTGTACACCG 


TGGATGCCGC 


CTACTATGGC 


1001 


AACATCTCCC 


ACTTTGTCAA 


CCACAGTTGT 


GACCCCAACC 


TGCAGGTGTA 


1051 


CAACGTCTTC 


ATAGACAACC 


TTGACGAGCG 


GCTGCCCCGC 


ATCGCTTTCT 


1101 


TTGCCACAAG 


AACCATCCGG 


GCAGGCGAGG 


AGCTCACCTT 


T G ATT AC AAC 


1151 


ATGCAAGTGG 


ACCCCGTGGA 


C AT GG AG AG C 


ACCCGCATGG 


ACTCCAACTT 


1201 


TGGCCTGGCT 


GGGCTCCCTG 


GCTCCCCTAA 


GAAGCGGGTC CGTATTGAAT 
ACCTCTTCTA GCCCTTAGAA 


1251 


GCAAGTGTGG 


GACTGAGTCC 


TGCCGCAAAT 


1301 


GTCTGAGGCC 


AGACTGACTG 


AGGGGGCCTG 


AAGCTACATG 


CACCTCCCCC 


1351 


ACTGCTGCCC 


TCCTGTCGAG 


AATGACTGCC 


AGGGCCTCGC 


CTGCCTCCAC 
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Offenlegungstag: 
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14. November 1996 







Fi 


g. 7/2 






1401 


CTGCCCCCAC 


CTGCTCCTAC 


CTGCTCTACG 


TTCAGGGCTG 


TGGCCGTGGT 


1451 


GAGGACCGAC 


TCCAGGAGTC 


CCCTTTCCCT 


GTCCCAGCCC 


CATCTGTGGG 


1501 


TTGCACTTAC 


AAACCCCCAC 


CCACCTTCAG 


AAATAGTTTT 


TCAACATCAA 


1551 


GACTCTCTGT 


CGTTGGGATT 


CATGGCCTAT 


TAAGGAGGTC 


CAAGGGGTGA 


1601 


GTCCCAACCC 


AGCCCCAGAA 


TATATTTGTT 


TTTGCACCTG 


CTTCTGCCTG 


1651 


GAGATTGAGG 


GGTCTGCTGC 


AGGCCTCCTC 


CCTGCTGCCC 


CAAAGGTATG 


1701 


GGGAAGCAAC 


CCCAGAGCAG 


GCAGACATCA 


GAGGCCAGAG 


TGCCTAGCCC 


1751 


GACATGAAGC 


TGGTTCCCCA 


ACCACAGAAA 


CTTTGTACTA 


GTGAAAGAAA 


1801 


GGGGTCCCTG 


GCCTACGGGC 


TGAGGCTGGT 


TTCTGCTCGT 


GCTTACAGTG 


1851 


CTGGGTAGTG 


TTGGCCCTAA 


GAGCTGTAGG 


GTCTCTTCTT 


CAGGGCTGCA 


1901 


TATCTGAGAA 


GTGGATGCCC 


ACATGCCACT 


GGAAGGGAAG 


TGGGTGTCCA 


1951 


TGGGCCACTG 


AGCAGTGAGA 


GGAAGGCAGT 


GCAGAGCTGG 


CCAGCCCTGG 


2001 


AGGTAGGCTG 


GGACCAAGCT 


CTGCCTTCAC 


AGTGCAGTGA 


AGGTACCTAG 


2051 


GGCTCTTGGG 


AGCTCTGCGG 


TTGCTAGGGG 


CCCTGACCTG 


GGGTGTCATG 


2101 


ACCGCTGACA 


CCACTCAGAG 


CTGGAACCAA 


GATCTAGATA 


GTCCGTAGAT 


2151 


AGCACTTAGG 


AC AAGAATG T 


GCATTGATGG 


GGTGGTGATG 


AGGTGCCAGG 


2201 


CACTAGGTAG 


AGCACCTGGT 


CCACGTGGAT 


TGTCTCAGGG 


AAGCCTTGAA 


2251 


AACCACGGAG 


GTGGATGCCA 


GGAAAGGGCC 


CATGTGGCAG 


AAGGCAAAGT 


2301 


ACAGGCCAAG 


AATTGGGGGT 


GGGGGAGATG 


GCTTCCCCAC 


TATGGGATGA 


2351 


CGAGGCGAGA 


GGGAAGCCCT 


TGCTGCCTGC 


CATTCCCAGA 


CCCCAGCCCT 


2401 


TTGTGCTCAC 


CCTGGTTCCA 


CTGGTCTCAA 


AAGTCACCTG 


CCTACAAATG 


2451 


TACAAAAGGC 


GAAGGTTCTG 


ATGGCTGCCT 


TGCTCCTTGC 


TCCCCCACCC 


2501 


CCTGTGAGGA 


CTTCTCTAGG 


AAGTCCTTCC 


TGACTACCTG 


TGCCCAGAGT 


2551 


GCCCCTACAT 


G AG ACTGT AT 


GCCCTGCTAT 


CAGATGCCAG 


ATCTATGTG7 


2601 


CTGTCTGTGT 


GTCCATCCCG 


CCGGCCCCCC 


AGACTAACCT 


CCAGGCATC-C- 


2651 


ACTGAATCTG 


GTTCTCCTCT 


TGTACACCCC 


TCAACCCTAT 


GCAGCCTGGA 


2701 


GTGGGCATCA 


AT AAAA7 G A A 


CTGTC3ACTG 


AAAAAAAAAA 


TGTCGAC 
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ZEICHNUNGEN SEITE 10 
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Fig. 8 



18 44 TCTTACTTGTGGAGCCGCTGACCATTGGGACAGTAAAAATGTGTCCTGCA 18 93 
II I i HIM Ml I II II I I I I 1 I I II I I I I I I I I 

1 ACTCACCTGTGGGGCCTCAGAGCACTGGGACTGCAAGGTGGTTTCCTGTA 50 



* • • « • 

18 94 AGAACTGCAGTATTCAGCGGGGCTCCAAAAAGCATCTATTGCTGGCACCA 1943 
I I I M I II I II II II I I I II I I I II I I M M I I I M 
51 AAAACTGCAGCATCCAGCGTGGACTTAAGAAGCACCTGCTGCTGGCCCCC 100 
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HEZ-2 

HEZ-1 
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